靠谱!基于MGISEQ-2000的外显子解决方案测评
MGISEQ-2000自推出以来,以其卓越的性能表现及超高性价比,被称为测序平台中的性能之王。今天给大家带来的是纳昂达科技基于MGISEQ-2000平台的NadPrep for MGI + IDT Exome v2整体解决方案测评。
方案背景
对基因组DNA样本Y1、Y2样本采取NadPrep for MGI_UDI + IDT Exome v2的捕获测序方案,然后将同一捕获文库在HiSeq X Ten平台及MGISEQ-2000平台分别进行测评。
▪ 捕获方法:IDT Exome v2
▪ 建库方法:纳昂达NadPrep for MGI_UDI
▪ 测序平台:MGISEQ-2000,HiSeq X Ten
▪ 测序试剂:CoolMPS 高通量测序试剂套装(MGISEQ-2000RS FCL PE100),HiSeq X Ten测序试剂盒(HiSeq X Ten Reagent Kit v2.5)
测评1:有效覆盖深度
将测序数据直接比对到UCSC的hg38参考基因组后,分析去重后覆盖深度,如图1所示。结果表明:采用CoolMPS测序试剂套装的MGISEQ-2000的有效覆盖深度上相对更高。
图1 IDT Exome v2在HiSeq X Ten平台及MGISEQ-2000平台的平均覆盖深度
分别用NadPrep for MGI对Y1、Y2建库后进行杂交捕获,同一杂交文库分别采用MGISEQ-2000 CoolMPS(PE100, ECR4.0)和HiSeq X Ten (PE150)进行测序,取5 Gb数据进行分析。
此外,通过此次测评,我们也惊喜地发现,采用CoolMPS测序试剂套装的MGISEQ-2000在GC-rich区域的表现得到了一定程度的整体提升,如图2所示。分别用NadPrep for MGI对Y1、Y2建库后进行杂交捕获,同一杂交文库分别采用CoolMPS(PE100, ECR4.0)及StandardMPS(PE150, ECR4.0)进行测序,取5 Gb数据进行分析。
同一 IDT Exome v2 捕获后文库,在MGISEQ-2000平台上分别采用CoolMPS和StandardMPS测序试剂套装测序后,对GC偏好性进行了分析,如图2所示。
图2 IDT Exome v2在MGISEQ-2000平台CoolMPS和StandardMPS测序试剂套装下的GC偏好性
A. 相同探针区域在测序数据中覆盖深度的比较。颜色代表探针GC含量。
B. 不同GC含量区域覆盖。
测评2:重复碱基读取能力
以微卫星区域的Soft clip reads比例对两个平台的重复碱基读取能力进行测评。所谓微卫星不稳定,即微卫星位点发生重复碱基的插入和缺失,其所包含的简单重复序列对测序提出了挑战。因模板滑动现象,测序读长通过重复序列后碱基质量可能会迅速下降,造成后面的读长难以比对而被比对软件软切除(Soft clip)。与illumina平台的桥式PCR不同,MGI平台采用DNA纳米球测序技术生成测序模板。两个平台对于简单重复序列的读取因此可能存在差异。
由于本次测评存在PE150(HiSeq X Ten)和PE100(MGISEQ-2000)的测序读长差异,我们将PE150截取前100个碱基,模拟PE100:取用MGISEQ-2000 PE100的原始下机数据,对HiSeq X Ten PE150下机数据取前100碱基,直接比对到UCSC的hg19参考基因组。
考虑到经典微卫星位点多为一定长度的A/T的单碱基重复,此处使用超过15 nt的A/T重复的微卫星位点对比同一个样本在不同平台下的Soft clip reads占比差别。
结果如图3所示,与HiSeq X Ten相比,MGISEQ-2000相对更有优势。
图3 不同测序平台与测序试剂微卫星位点的Soft clip reads占比
微卫星筛选标准如下:A/T >=15 bp。数据比对后的bam中的Soft clip reads相对微卫星区域总reads数的比率。PE*100 原始PE150取前100碱基。
测评总结
通过对NadPrep for MGI + IDT Exome v2整体解决方案在多平台的测评,充分显示了MGISEQ-2000对重复碱基的读取优势及其测序试剂(CoolMPS测序试剂套装)对高GC含量区域的读取改进。
纳昂达将在5月份推出NadPrep for MGI-UDI建库方案及高效的封阻序列NadPrep NanoBlockers (for MGI, DI)。UDI(Unique dual index, UDI)的引入将克服靶向测序全流程中潜在串扰的问题,实现MGI平台在更多场景下的应用。
了解更多: